#뉴런 회로

MarkTechPost • 67일 전

IMP 8

Nous Research, LLM 제어 기술 CNA 발표

Nous Research가 희소 MLP 뉴런 회로를 식별 및 제거하여 대형 언어 모델(LLM)의 동작을 제어하는 새로운 기술인 대조적 뉴런 기여도(Contrastive Neuron Attribution, CNA)를 발표했습니다. 이 방법은 Sparse Autoencoder(SAE) 학습이나 모델 가중치 수정 없이도 모델의 일반적인 성능 저하 없이 행동을 제어할 수 있어 효율성이 뛰어납니다.

모델 제어 뉴런 회로 해석 가능성